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(57) Abstract: The invention relates to a method for introducing information into a data stream containing data related to spectral 
values which represent a short-term spectrum of an audio signal. According to said method, the data stream is first processed (10, 
16, 18), in order to obtain the spectral values for the short-term spectrum of the audio signal. In addition, the information to be 
introduced is subjected to a spread sequence (20) in order to obtain an expanded infcHmation signal which leads to the creation of a 
spectral r^)resentation of the expanded information signal (20). This representation is then weighted using a determined psychoa- 
coustic noise energy whidi can be masked (20), in order to generate a weighted information signal, in which the energy level of 
die introduced information is substantially equal to or lies below the psychoacoustic masking threshold. The weighted information 
signal and the spectral values for the short-term spectrum are subsequently totalled (20) and then re-processed (22, 24. 26) in order 
to obtain a processed data stream which comprises both the audio infom:iation and the information to be introduced. In order for the 
information to be introduced without having to pass into the time domain, the block rast^ which imd^lies the short-term spectrum 
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des Datenstroms dutch, urn die Spddralwerte des ^^^i^ informationssignal zu eihalten, woraiifhin 

bringenden Informationen mit einer Spreascquenz beaufschlagt (20). um em ^^Tt^ZLiner ^ttelten psychoakustisch 

angelastet, so daB das Einbringen eines Wasserzeicbens zu keinen Tandem-Codiereffelflen fiihrt. 
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Verfahren und Vorrichtung zum Elnbringen von Inf ormationen 
in einen Dat:ens1:rom sowie Verfahren und Vorrichtung zum 
Codleren elnes Audxosignals 



Die vorliegende Erfindung bezieht sich allgemein auf Audio- 
signale und insbesondere auf das Einbringen von Informatio- 
nen in einen Datenstrom, der Spektralwerte aufweist, die ein 
Kurzzeitspektrum eines Audiosignals darstellen. Insbesondere 
auf dem Gebiet der Urheberrechtsschutzes fiir Audiosignale 
dient die vorliegende Erfindung dazu, beispielsweise Urhe- 
berrechtsinf ormationen in ein Audiosignal moglichst unhorbar 
einzubringen • 

Mit zunehmender Verbreitung des Internets hat auch die Mu- 
sikpiraterie drastisch zugenommen. An vielen Stellen im In- 
ternet konnen Musikstucke bzw. allgemein Audiosignale herun- 
tergeladen werden. In den allerwenigsten FSllen werden hier- 
bei Urheberrechte beachtet. Insbesondere wird sehr selten 
die Erlaubnis des Urhebers eingeholt, sein Werk zur Verfii- 
gung zu stellen* Noch seltener werden Gebiihren an den Urhe- 
ber bezahlt, die der Preis fiir ein rechtmaBiges Kopieren 
sind. Dariiberhinaus findet ein unkontrolliertes Kopieren von 
Werken statt, was in den allermeisten Fallen ebenfalls ohne 
Berucksichtigung von Urheberrechten geschieht. 

Wenn Musikstucke uber das Internet von einem Provider fiir 
Musikstucke rechtmaBig erworben werden, erzeugt der Provider 
iiblicherweise einen Header, in dem Copyright- Inf ormationen 
sowie beispielsweise eine Kundennummer eingebracht sind, wo- 
bei die Kundennummer eindeutig auf den aktuell vorliegenden 
Kaufer hinweist. Es ist ferner bekannt, Kopiererlaubnisin- 
f ormationen in diesen Header einzufiigen, welche die ver- 
schiedensten Arten von Kopierrechten signalisieren, wie z. 
B. daB das Kopieren des aktuellen Stucks vollstandig unter- 
sagt ist, daB das Kopieren des aktuellen Stiicks nur ein 
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einziges Mai erlaubt ist, daB das Kopieren des aktuellen 
Stucks vollig frei ist^ etc. 

Der Kunde verfugt iiber einen Decodierer, der den Header ein- 
liest und unter Beachtung der erlaubten Handlungen bei- 
spielsweise nur eine einzige Kopie zulSJSt und weitere Kopien 
verweigert . 

Dieses Konzept zur Beachtung der Urheberrechte funktioniert 
jedoch nur fur Kunden, die sich legal verhalten. 

Illegale Kunden haben iiblicherweise ein wesentliches Poten- 
tial an Kreativitat^ um mit einem Header versehene Musik- 
stucke zu "knacken". Hier zeigt sich bereits der Nachteil 
der beschriebenen Vorgehensweise zum Schutz von Urheberrech- 
ten. Ein solcher Header kann einfach entfernt warden. Alter- 
nativ konnte ein illegaler Benutzer auch einzelne Eintrage 
in dem Header modif izieren, um beispielsweise aus dem Ein- 
trag "Kopieren untersagt" einen Eintrag "Kopieren vollig 
frei" zu machen. Denkbar ist auch der Fall, daJ3 ein ille- 
galer Kunde seine eigene Kundennuinmer aus dem Header ent- 
fernt und dann das Musikstiick auf seiner oder einer anderen 
Homepage im Internet anbietet. Ab diesem Moment ist es nicht 
mehr moglich, den illegalen Kunden zu ermitteln, da er seine 
Kundennummer entfernt hat. Versuche, solche Verletzungen des 
Urheberrechts zu unterbinden, werden daher zwangslaufig ins 
Leere laufen, da die Kopierinformationen aus dem Musikstiick 
entfernt worden sind bzw. modifiziert worden sind, und da 
der illegale Kunde, der dies tat, nicht mehr ermittelt 
werden kann, um ihn zur Verantwortung zu ziehen. Ware 
stattdessen eine sichere Einbringung von Inf ormationen in 
das Audiosignal vorhanden, so konnten staatliche Behorden, 
die Urheberrechtsverletzungen verfolgen, verdachtige Musik- 
stiicke im Internet ermitteln und beispielsweise die Be- 
nutzeridentifikation solcher illegalen Stucke feststellen, 
um den illegalen Benutzern das Handwerk zu legen. 



Aus der WO 97/33391 ist ein Codierverf ahren zur Einbringung 
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eines nicht horbaren Datensignals in ein Audiosignal be- 
kannt. Dabei wird das Audiosignal, in das das nicht horbare 
Datensignal eingebracht werden soli, in den Frequenzbereich 
umgewandelt, um mittels eines psychoakustischen Modells die 
Maskierungsschwelle des Audiosignals zu bestimmen. Das Da- 
tensignal, das in das Audiosignal eingebracht werden soil, 
wird mit einem Pseudorauschsignal multipliziert, um ein fre- 
quenzma/3ig gespreiztes Datensignal zu schaffen. Das fre- 
quenzmaBig gespreizte Datensignal wird dann mit der psycho- 
akustischen Maskierungsschwelle gewichtet, derart, dal3 die 
Energie des f requenzmaj3ig gespreizten Datensignals immer un- 
terhalb der Maskierungsschwelle liegt. SchlieJ31ich wird das 
gewichtete Datensignal dem Audiosignal iiberlagert, wodurch 
ein Audiosignal erzeugt wird, in das das Datensignal unhor- 
bar eingebracht ist. Das Datensignal kann zum einen dazu 
verwendet werden, die Reichweite eines Senders zu ermitteln. 
Alternativ kann das Datensignal zur Kennzeichnung von Audio- 
signalen verwendet werden, um eventuelle Raubkopien ohne 
weiteres zu identif izieren, da jeder TontrSger beispielswei- 
se in Form einer CompactDisc ab Werk mit einer individuellen 
Kennung versehen wird. Weitere beschriebene AnwendungsmSg- 
lichkeiten des Datensignals bestehen im Fernsteuern von 
Audiogeraten in Analogie zum "VPS"-Verf ahren beim Fernsehen. 

Dieses Verf ahren liefert bereits eine hohe Sicherheit gegen- 
Uber Musikpiraten, da sie zum einen unter Umstanden gar 
nicht wissen, daB das MusikstUck, das sie gerade vervielfal- 
tigen, gekennzeichnet ist. Daruberhinaus ist es nahezu un- 
moglich, ohne einen autorisierten Decodierer das Datensi- 
gnal, das unhorbar in dem Audiosignal vorhanden ist, zu ex- 
trahieren . 



Audiosignale liegen, wenn sie von einer CompactDisc stammen, 
als 16-Bit-PCM-Abtastwerte vor. Ein Musikpirat konnte bei- 
spielsweise die Abtastrate bzw. die Pegel oder Phasen der 
Abtastwerte manipulieren, um das Datensignal unlesbar, d- h. 
undecodierbar zu machen, wodurch die Urheberrechtsinforma- 
tionen ebenfalls aus dem Audiosignal entfernt waren. Dies 
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lich gravierender ist jedoch die Tatsache, daJ3 bei einer 
solchen Vorgehensweise Tandem-Codieref f ekte auftreten. 

Ein weiterer Nachteil dieser Vorgehensweise besteht darin, 
daJ3 aufgrund der Tatsache^ daJ3 das Wasserzeichen in die 
PCM-Dalien eingebracht wird, keine Sicherheit daruber gegeben 
ist, ob das Wasserzeichen nach einer Audio-Komprimierung 
noch vorhanden ist. Wenn mit Wasserzeichen versehene PCM- 
Daten mit relativ niedriger Bitrate codiert werden, fuhrt 
der Codierer beim Quantisieren aufgrund der relativ niedri- 
gen Bitrate viel Quantisierungsrauschen ein, das im extremen 
Fall dazu fiihren wird, daB kein Wasserzeichen mehr decodiert 
werden kann. Problematisch ist also, daB bei dieser Vorge- 
hensweise die Bitrate des Audiocodierers , der die mit Was- 
serzeichen versehenen PCM-Daten codiert, nicht von vornehe- 
rein bekannt ist, weshalb keine sichere Steuerung des Ver- 
haitnisses zwischen Wasserzeichenenergie und Storenergie 
aufgrund des Quantisierungsrauschens moglich ist. 

Es ist bekannt, daJ3 Audio-Codierverf ahren nach einem der 
MPEG-Standards keine verlustlosen Codierverf ahren, sondern 
verlustbehaftete Codierverf ahren sind. Biteinsparungen im 
Vergleich zur direkten Ubertragung von Audio-Abtastwerten im 
Zeitbereich werden zu einem GroBteil dadurch erreicht, daB 
psychoakustische Maskierungsef f ekte ausgenutzt werden. Ins- 
besondere wird fur einen Block von beispielsweise 204 8 Au- 
dio-Abtastwerten die psychoakustische Maskierungsschwelle 
als Funktion der Frequenz ermittelt, woraufhin nach einer 
Zeit-Frequenz-Transformation der Audio-Abtastwerte die Quan- 
tisierung der Spektralwerte , die das Kurzzeitspektrum ent- 
halt, unter Beriicksichtigung dieser psychoakustischen Mas- 
kierungsschwelle durchgefuhrt wird. Anders ausgedriickt wird 
die Quantisierer-Schrittweite so gesteuert, daB die durch 
das Quantisieren eingefiigte Storenergie kleiner oder gleich 
der psychoakustischen Maskierungsschwelle ist. In Bereichen 
des Audiosignals, in denen das VerdeckungsmaB , d. h, das 
Verhaltnis der Audiosignalenergie und der psychoakustischen 
Maskierungsschwelle, sehr klein ist, wie z. B. in sehr 
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rauschhaften Bereichen des Audlosignals , mussen die Spek- 
trax„er.e lediglich grob ,ua„tislert werden, ohne di es 
nach e.„e», anschlieBenden Decodieren zu harbaren Storungen 

tonal ast muB feiner quantisiert warden, derart, daB elne 
steh\"d 3t6re„er,ie aufgrund des 0..n.Ui.r.ns Z- 

steht, da das VerdeckungsmaO hier sehr groB ist. 

Aus dem Vorstehenden wird deutlich, daB aufgrund der ouanti- 

d.os.gnals verloren gehen. Dies spielt noch keine RolU, 
wenn das ,uantisierte Audiosignal wieder decodiert wird, da 
d.e Storenergxe aufgrund des Quantisierens so verteilt ;ur- 
bllll """" Psyohoakustischen Maskierungsschweile 

blexbt und somxt, wenn ein ideales psyohoakustisches Modell 

ge^:: dT-^' BetrachJge" 
gelten ,edoch r^ner nur fttr ein besti™tes Kur.zeitspektL 
bzw fur exnen Block von b. 2.048 aufeinanderfoLenden 
Aud.o-Abtastwerten. Nach der Decodierung enthait der BlLk 
von Aud.o-Abtastwerten iedoch keine Infor^ationen nehr dl 
ruber, „xe dxe Blockbildung durchgefilhrt wurde. wenn die 

wend't r'°''""' ^in^ringen von Infor„ationen ver- 

wendet w.rd, dre in den aller^eisten Pailen eine besti««:e 

InfZaT"' ^'"^ Audio-codierer, der k^e 

informatxonen einbringt, hat, kann nicht davon ausgegangen 
werden, daB rein zufMllig die gleiche Blockeinteilung IZZ 
fxndet. Stattdessen werden die Blockeinteilung, die Kurz- 

»der'eTB?T'"""' Quantisierung in \i„e„ vSnlg 

anderen Blockraster stattfinden. Eine erneute Decodierung 

fS^ren d" '^''""^"^'^^ - O-^^ch h«rbaren sterungen 
fuhren, da sre sich nicKt auf das gleiche Kurz.eitspektL 
sondern auf unterschiedliche Kurzzeitspektren bLiehT 
Dxeses Auftreten von harbaren stSrungen durch zwei Codiel 
rer Decod.erer-stufen aufgrund ihrer unterschiedlichen Bin- 
teilung des stroms von Audio-Abtastwerten in Blacke wird als 
Tandem-codiereffekt bezeichnet. 

Es sei hier darauf hingewiesen, daB in allgemeinen Fall 
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durch das Einbringen des nicht-horbaren Datensignals Stor- 
energie in das Audiosignal eingefuhrt wird, das ohnehin 
schon Storenergie aufgrund des nicht unendlich feinen Quan-. 
tisierungsverf ahrens hat. Das Einbringen des nicht-horbaren 
Datensignals fuhrt damit tendenziell zu einer Verschlechte- 
rung der Audioqualitat , es sei denn, daJ3 besondere Vorkeh- 
rungen unternommen warden. In diesem Zusammenhang ist eine 
zusatzliche Einfiihrung von Storenergie aufgrund der Tan- 
dem-Codieref fekte, die vorstehend ausgefuhrt wurden, umso 
weniger wunschenswert, da dieser Qualitatsverlust einfach 
systembedingt ohne Nutzen auftritt, wahrend kleine Quali- 
tatsverschlechterungen aufgrund des Wasserzeichens eher in 
Kauf genommen werden, da das Wasserzeichen einen Nutzen mit 
sich bringt. Tandem-Codieref f ekte bringen jedoch nur Storun- 
gen, aber uberhaupt keinen Nutzen mit sich. 

Die Aufgabe der vorliegenden Erfindung besteht darin, ein 
Konzept zu schaffen, das es ermoglicht^ Audiostucke mit ei- 
nem Wasserzeichen zu versehen, wahrend die Auswirkungen des 
Wasserzeichens auf die Audioqualitat moglichst gering sein 
sollen. 

Diese Aufgabe wird durch ein Verfahren zum Einbringen von 
Informationen in einen Datenstrom nach Patentanspruch 1, 
durch ein Verfahren zum Codieren eines Audiosignals nach Pa- 
tentanspruch 11 Oder 12, durch eine Vorrichtung zum Einbrin- 
gen von Informationen nach Patentanspruch 13 und durch eine 
Vorrichtung zum Codieren eines Audiosignals nach Patentan- 
spruch 15 Oder Patentanspruch 16 gelost. 

Der vorliegenden Erfindung Ixegt die Erkenntnis zugrunde, 
daJ3 davon abgegangen werden muB, vor dem Einbringen des Was- 
serzeichens eine vollstandige Decodierung durchzuf uhren. 
Stattdessen wird erf indungsgemaB ein Datenstrom, der Spek- 
tralwerte aufweist, die ein Kurzzeitspektrum eines Audiosi- 
gnals darstellen, lediglich teilweise "entpackt", bis die 
Spektralwerte vorliegen. Die Entpackung ist jedoch keine 
vollstandige Decodierung sondern lediglich eine teilweise 
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Decodierung/ bei der die Inf ormationen iiber die Blockbildung 
bzw. das im urspriinglichen Codierer eingesetzte Blockraster 
nicht angetastet warden. 

Dies wird dadurch erreicht, daJi das erf indungsgemaBe Verfah- 
ren mit Spektralwerten und nicht mit zeitlichen Abtastwerten 
(Samples) durchgefiihrt wird. Die Inf ormationen, die in das 
Audiosignal eingebracht werden sollen, werden im Sinne eines 
Spread-Spectrum-Modulation mit einer Spreizsequenz beauf- 
schlagt, urn ein gespreiztes Inf ormationssignal zu erhalten. 
AnschlieBend wird eine spektrale Darstellung des gespreizten 
Inf ormationssignals beispielsweise durch eine Filterbank, 
eine FFT, einer MDCT oder ahnliches erzeugt, urn ein spektra- 
les gespreiztes Inf ormationssignal zu erhalten. Nun wird ei- 
ne psychoakustisch maskierbare Storung als Funktion der Fre- 
guenz fiir das Kurzzeitspektrum des Audiosignals ermittelt, 
um dann das spektrale gespreizte Inf ormationssignal unter 
Verwendung der ermittelten Storenergie zu gewichten, so daJ3 
ein gewichtetes Inf ormationssignal erzeugt werden kann, des- 
sen Energie im wesentlichen gleich oder unterhalb der psy- 
choakustischen Maskierungsschwelle liegt. Daran anschliefiend 
wird das gewichtete Inf ormationssignal mit den Spektralwer- 
ten des Kurzzeitspektrums des Audiosignals summiert, um Sum- 
men- Spektralwerte zu erhalten, die das Kurzzeitspektrum des 
Audiosignals und zusatzlich die eingebrachten Inf ormationen 
umfassen. SchlieBlich werden die Summen-Spektralwerte wieder 
verarbeitetr um einen verarbeiteten Datenstrom zu erhalten, 
der die Daten uber die Spektralwerte des Kurzzeitspektrums 
des Audiosignals und die einzubringenden Inf ormationen um- 
faBt. im Falle eines MPEG-AAC-Codierers wird das Verarbeiten 
der Summen-Spektralwerte wieder das Quantisieren und Entro- 
pie-Codieren beispielsweise unter Verwendung eines Huffman- 
Codes zum Gegenstand haben. 

Es sei darauf hingewiesen, daB dadurch nicht die Blockraste- 
rung, die der ursprlingliche Codierer festgelegt hat, der den 
Datenstrom erzeugt hat, angetastet wird. Dadurch entstehen 
keine Tandem-Ef f ekte, die zu einem Verlust der Audioqualitat 
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fiihren wiirden. Darliberhinaus wird es bevorzugt, dal3 bei der 
nach dem Gewichten erfolgenden Verarbeitung, die ein Quanti- 
sieren umfaBt, die gleiche bzw. die gleichen Quantisierungs- 
schrittweite(n) wie im urspriinglichen Bitstrom verwendet 
wird bzw. werden, was den Vorteil mit sich bringt, daJ3 die 
sehr rechenaufwendigen Iterationsschleif en des Quantisierers 
nicht erneut berechnet werden mussen. Ferner treten keine 
Tandem-Codier-Ef fekte auf , die ansonsten unvermeidbar waren, 
da im Falle einer erneuten Berechnung mehr oder weniger 
stark abweichende Quantisiererschrittweiten auftreten konn- 
"ten. 

Das erf indungsgemaBe Einbringen eines Wasserzeichens direkt 
in einen Datenstrom ermoglicht beispielsweise das Einbringen 
einer Kundennummer wahrend der Auslieferung der Musik an ei- 
nen Kunden, da das Verfahren auf modernen Personalcomputern 
in mehrfacher Echtzeit ablaufen kann^ da u. a. zusatzlich 
auf die aufwendige Frequenz-Zeit-Transf ormation verzichtet 
werden kann^ die bei einer vollstSndigen Decodierung erf or- 
der lich sein wiirde. 

Ein weiterer Vorteil der vorliegenden Erfindung besteht dar- 
in, daJ3 der Musikanbieter , d. h. der Musikprovider , nicht 
mehr die PCM-Abtastwerte speichern muJ3, sondern vorcodierte 
Datenstrome speichern kann, was im Speicherplatz durchaus 
einen Faktor in der Groi3enordnung von 12 mit sich bringen 
kann, und daJ3 der Provider trotzdem kundenspezif ische Was- 
serzeichen einbringen kann, ohne daJ3 zusatzlich Tandem-Co- 
diereffekte auftreten wurden^ die einen Audioqualitatsver- 
lust zur Folge hatten. 

Das erf indungsgemaBe Verfahren kann einfach implementiert 
werden, da nur eine zusatzliche Zeit/Frequenz-Transf ormation 
des gespreizten Inf ormationssignals erforderlich ist* Ein 
weiterer wesentlicher Vorteil besteht darin, daJJ das erf in- 
dungsgemaBe Verfahren eine gute Interoperabilitat besitzt, 
d. h. daB Standard-Datenstrome verarbeitet werden konnen, 
und daB fur Wasserzeichen gemaB den bekannten Verfahren und 



wo 01726262 



- 10 - 



PCTyEPOO/09771 



fiir Wasserzeichen gemafl dem erf indungsgemaBen Verfahren der 
gleiche wasserzeichendecodierer verwendet werden kaixn. 
SchlieBlich besteht ein weiterer Vorteil darin, daB ein Au- 
diocodierer das Wasserzeichen nicht mehr ausloschen kann, da 
eine genaue Steuerung des VerhSltnisses zwischen Quantisie- 
rungsrauschen und Wasserzeichenenergie besteht. 

Es sei darauf hingewiesen^ daB es selbstverstandlich moglich 
ist, das Wasserzeichen unbefugt wieder zu entfernen, wenn 
der mit. einem Wasserzeichen versehene Datenstrom decodiert 
wird und dann wieder codiert wird^ jedoch nun mit niedriger 
Bitrate. In diesem Fall wird die durch den Quantisierer ein- 
gefuhrte Storenergie die Wasserzeichenenergie ubersteigen, 
so daB dann kein Wasserzeichen mehr aus dem Audiosignal ex- 
trahiert werden kann. Dies ist jedoch unproblematisch, da 
die Audioqualitat des Audiosignals aufgrund des hohen Quan- 
tisierungsrauschen derart stark abgenommen hat, daB ein sei- 
ches schlechtes Audiosignal auch nicht mehr geschutzt werden 
muB. Ist namlich in einem Audiosignal das Wasserzeichen zer- 
stort, so ist auch seine Qualitat zerstort. 

Die psychoakustisch maskierbare Storenergie kann auf ver- 
schiedene Arten und Weisen ermittelt werden* Eine erste Op- 
tion besteht darin, zum Ermitteln der psychoakustisch mas- 
kierbaren Storenergie ein psychoakustisches Modell einzu- 
setzen, das aus dem Kurzzeitspektrum die psychoakustische 
Maskierungsschwelle als Funktion der Frequenz erzeugt. Es 
existiert eine Vielzahl von psychoakustischen Modellen, wo- 
bei hier die psychoakustischen Modelle besonders von Vorteil 
sind, die ohnehin mit Spektralwerten des Kurzzeitspektrums 
arbeiten, da diese Spektralwerte direkt aufgrund des teil- 
weisen Entpackens des Datenstroms vorliegen. Alternativ kon- 
nen jedoch auch psychoakustische Modelle zum Einsatz kommen^ 
die fiir Zeitbereichsdaten ausgestaltet sind, wobei hier im 
Gegensatz zu der oben beschriebenen Option eine Frequenz- 
Zeit-Transformation erforderlich sein wurde. Obwohl die Mog- 
lichkeit des Berechnens eines psychoakustischen Modells^ vm 
die psychoakustische Maskierungsschwelle des Kurzzeitspek- 
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trums 2u erhalten, relativ rechenzeitaufwendig ist, liefert 
jedoch bereits diese Moglichkeit den entscheidenden Vorteil, 
dafl keine Tandem-Codieref f ekte erzeugt werden, da die Block- 
rasterung nicht angetas-bet: wird. 

Eine weitere, im Rechenzeitaufwand giinstigere Option zum Er- 
mitteln der psychoakustisch maskierbaren Storenergie besteht 
darin, da/3 der Datenstrom derart erzeugt worden ist^ daJ3 er 
neben den Spektralwerten und den ublichen Seiteninf orma- 
tionen auch fiir jedes Kurzzeitspektrum die psychoakustische 
Maskierungsschwelle als Funktion der Frequenz enthalt. Ein 
Ermitteln der psychoakustisch maskierbaren Storenergie funk- 
tioniert dann einfach durch Extrahieren der im Datenstrom 
ubertragenen psychoakustischen Maskierungsschwelle. Bei die- 
ser Moglichkeit und der vorher beschriebenen Moglichkeit, 
bei der das psychoakustische Maskierungsmodell berechnet 
wird, ist die psychoakustisch maskierbare Storenergie die 
psychoakustische Maskierungsschwelle selbst. Nachteilig an 
dem Verfahren des Ubertragens der psychoakustischen Maskie- 
rungsschwelle im Datenstrom ist die Tatsache, daB ein Spe- 
zial-Audiocodierer benotigt wird, da bei ublichen Audio-Co- 
dierern die psychoakustische Maskierungsschwelle nicht uber- 
tragen wird, sondern lediglich die Spektralwerte und die 
entsprechenden Skalenf aktoren. In geschlossenen Systemen ist 
jedoch Kompatibilitat zu Standard-Datenstromen nicht er- 
forderlich. Hier kann diese Option daher mit einfachem Auf- 
wand und rechenzeitgunstig implementiert werden. 

Eine weitere Moglichkeit besteht darin, einen Spezial-Audio- 
codierer vorzusehen, dessen Quantisierer immer so arbeitet, 
daS das Quantisierungsrauschen um einen vorbestimmten Betrag 
geringer als die psychoakustische Maskierungsschwelle ist* 
Dies bedeutet, dal3 der Codierer so ausgelegt ist, daJ3 sein 
Quantisierer etwas feiner quantisiert, als er eigentlich 
miiflte, derart, daJ3 zusatzliche Storenergie hinzugefiigt wer- 
den kann, ohne dal3 eine Storung horbar wird* Diese zusatz- 
liche Storenergie kann dann beim Einbringen von Informatio- 
nen in den Datenstrom "auf gebraucht" werden, um die Informa- 
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tionen einzubringen. Im Falle eines optimalen psychoakusti- 
schen Modells fuhrt: diese Moglichkeit zu einem Datenstrom 
mit eingebrachtem Wasserzeichen, der xiberhaupt keine Quali- 
tatsverschlechterung erlitten hat. Nachteilig an diesem Ver- 
fahren ist ebenso wie beim direkten Ubertragen der psycho- 
akustischen Maskierungsschwelle die Tatsache, daJ3 dieses 
Verfahren nicht mit iiblichen Codierern kompatibel ist. 

Eine weitere Moglichkeit zum Ermitteln der psychoakustisch 
maskierbaren Storenergie besteht darin, die tatsachlich 
durch das Quantisieren des Codierers, der den Datenstrom 
erzeugt hat, eingebrachte Storenergie zu ermitteln und 
daraus die psychoakustisch maskierbare Storenergie, die die 
Informationen beim Gewichten erhalten werden, abzuleiten. 
Diese Option geht davon aus, daB der Codierer so quantisiert 
hat, daJ3 die Storenergie unter der psychoakustischen Maskie- 
rungsschwelle Oder lediglich knapp dariiber gelegen hat. Die- 
ses Verfahren kommt ebenfalls wie das als erste M5glichkeit 
beschriebene Verfahren mit den Standard-Bitstromen aus, da 
lediglich die Spektralwerte und die Skalenf aktoren, die 
beide im Datenstrom vorhanden sind, benotigt werden, um die 
psychoakustisch maskierbare Storenergie zu erhalten. Aus den 
Skalenf aktoren kann die SchrittgroBe des Quantisierers , der 
dem entsprechenden Skalenf aktor zugeordnet ist, ermittelt 
werden, um damit die in einem Skalenf aktorband eingebrachte 
Storenergie zu errechnen, die typischerweise gleich der psy- 
choakustischen Maskierungsschwelle sein wird oder darunter 
liegen wird. Die beim Gewichten verwendete psychoakustisch 
maskierbare Storenergie fur die eingebrachten Informationen 
kann gleich der Quantisierungsstorenergie sein, sie kann 
aber auch einen Faktor zwischen groBer als Null und kleiner 
als Eins haben, wobei ein Faktor naher bei Null zu weniger 
horbaren Storungen aufgrund des Wasserzeichens fiihren wird, 
aber beim Extrahieren problematischer sein konnte als ein 
Faktor naher bei Eins. 

Bevorzugte Ausf uhrungsbeispiele der vorliegenden Erfindung 
werden nachfolgend bezugnehmend auf die beiliegenden Zeich- 
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Fig. 

Fig. 
Fig. 

Fig. 
Fig. 
Fig. 
Fig. 



in detailliert erlautert. Es zeigen: 

1 ein Blockdiagramm einer erf indungsgema/3en Vorrich- 
tung zum Einbringen von Inf ormationen in einen Da- 
tenstrom; 

2 ein detailliertes Blockdiagramm der Wasserzeichen- 
einrichtung von Fig. 1; 

3a eine schematische Darstellung eines Verfahrens zum 
Ermitteln der maskierbaren Storenergie unter Ver- 
wendung eines psychoakustischen Modell; 

3b eine schematische Darstellung eines Verfahrens zum 
Ermitteln der maskierbaren Storenergie, wenn die 
psychoakustische Maskierungsschwelle im Datenstrom 
ubertragen wird; 

3c eine schematische Darstellung eines Verfahrens zum 
Ermitteln der maskierbaren Storenergie, wenn die 
Storenergie unter Kenntnis der Spektralwerte und 
der Skalenf aktoren geschatzt wird; 

3d eine schematische Darstellung eines Verfahrens zum 
Ermitteln der psychoakustisch maskierbaren Stor- 
energie, wenn im Datenstrom Energie fiir das Wasser- 
zeichen freigehalten wird; und 

4 ein Blockdiagramm eines erf indungsgemaBen Audioco- 
dierers, der entweder die psychoakustische Maskie- 
rungsschwelle in den Datenstrom schreibt, oder den 
vorbestimmten Betrag fur das in Fig. 3d beschrie- 
bene Verfahren in den Datenstrom schreibt und des- 
sen Quantisierer entsprechend gesteuert ist.. 



Bevor detaillierter auf die einzelnen Figuren eingegangen 
wird/ wird der systemtheoretische Hintergrund der vorliegen- 
den Erfindung kurz beleuchtet. Generell darf das Einbringen 
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der Informationen in das Audiosignal zu keiner bzw. nur ei- 
ner sehr schwer horbaren Qualitatsverschlechterung des 
Audiosignals fuhren. Um f estzustellen, wieviel Energie das 
Signal, das die einzubringenden Informationen darstellt, ha- 
ben darf, wird unter Verwendung eines psychoakustischen Mo- 
dells die Maskierungsschwelle des Audiosignals fortlaufend 
berechnet. Die f requenzselektive Berechnung der Maskierungs- 
schwelle unter Verwendung beispielsweise der kritischen Bin- 
der sowie eine vielzahl weiterer psychoakustischer Modelle 
sind in der Technik bekannt. Beispielhaft wird auf den Stan- 
dard MPEG2-AAC (ISO/IEC 13818-7) verwiesen. 

Das psychoakustische Modell fiihrt zu einer Maskierungs- 
schwelle fiir ein Kurzzeitspektrum des Audiosignals. Ubli- 
cherweise wird die Maskierungsschwelle uber der Frequenz va- 
riieren. Per Definition wird angenommen, dal3 ein in das 
Audiosignal eingebrachtes Signal dann unhorbar sein wird, 
wenn die Energie dieses Signals unterhalb der Maskierungs- 
schwelle ist. Die Maskierungsschwelle hSngt stark von der 
Zusammensetzung des Audiosignals ab. Rauschhafte Signale ha- 
ben eine hohere Maskierungsschwelle als sehr tonale Signale. 
Die Energie des Signals, das in das Audiosignal eingebracht 
wird, variiert daher stark iiber der Zeit. tiblicherweise wird 
zum Decodieren der in ein Audiosignal eingebrachten Informa- 
tionen ein bestimmtes Signal/Rausch-Verhaltnis benotigt. Da- 
bei kann es vorkommen, daJ3 bei sehr tonalen Audiosignalab- 
schnitten die Energie des zusatzlich eingebrachten Signals 
derart gering wird, daJ3 das Signal /Rausch-VerhSltnis zum 
sicheren Decodieren nicht mehr ausreicht. Ein Decodierer 
kann daher in solchen Bereichen einzelne Bits nicht mehr 
korrekt decodieren. Systemtheoretisch gesehen kann daher das 
Einbringen von Informationen in ein Audiosignal in AbhSngig- 
keit von der psychoakustischen Maskierungsschwelle als das 
Ubertragen eines Datensignals uber einen Kanal mit stark va- 
riierender Storenergie betrachtet werden, wobei das Audiosi- 
gnal, d. h. das Musiksignal, als Storsignal aufgefaBt wird. 

Pig. 1 zeigt ein Blockdiagramm einer erf indungsgemaBen Vor- 
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richtung bzw. eines erf indungsgemaJ3en Verfahrens zum Ein~ 
bringen von Inf ormationen in einen Datenstrom, der Spektral- 
werte aufweist, die ein Kurzzeitspektrum eines Audiosignals 
darstellen. Der Datenstrom, der am Eingang eines Daten- 
strom-Demultiplexers 10 anliegt/ wird, wenn er gemaJJ dem er- 
wahnten MPEG-AAC-Standard verarbeitet ist, zunachst allge- 
mein in Spektralwerte auf einer Leitung 12 und Seiteninfor- 
mationen auf einer Leitung 14 zerlegt, wobei von den Seiten- 
informationen hier die Skalenf aktoren speziell genannt sei- 
en. Die Spektralwerte, die hinter dem Demultiplexer 10 noch 
Entropie-codiert sind, werden dann einem Entropie-Decodierer 
16 zugefiihrt und dann einem inversen Quantisierer 18, der 
unter Verwendung der quantisierten Spektralwerte und der da~ 
zu gehorigen Skalenf aktoren, die uber die Leitung 14 dem 
inversen Quantisierer 18 zu Verfugung gestellt werden, die 
Spektralwerte des Audiosignals erzeugt, die das Kurzzeit- 
spektrum desselben darstellen. Die Spektralwerte werden dann 
in eine Wasserzeicheneinrichtung 20 eingespeist, die Sum- 
men-Spektralwerte erzeugt, die das Kurzzeitspektrum des Au- 
diosignals und daruber hinaus die einzubringenden Informa- 
tionen umfassen. Diese Suiranen- Spektralwerte werden dann 
wieder in einen Quantisierer 22 gespeist und in einem daran 
anschlieBenden Entropie-Codierer 24 Entropie-codiert , um 
schlieBlich einem Datenstrom-Multiplexer 2 6 zugefiihrt zu 
werden, der auch wieder die notigen Seiteninf ormationen, wie 
2. B. die Skalenf aktoren, erhalt. Am Ausgang des Multiple- 
xers 26 liegt dann ein verarbeiteter Datenstrom vor, der 
sich vom Datenstrom am Eingang des Demultiplexers 10 darin 
unterscheidet, daJ3 er nun ein Wasserzeichen hat, d. h. daB 
in ihn Inf ormationen eingebracht worden sind. 

Bevor naher auf Fig. 2 eingegangen wird, die eine detail- 
liertere Darstellung der Wasserzeicheneinrichtung 2 0 auf- 
weist, sei zum Verstandnis auf einen MPEG~2 AAC-Audiocodie- 
rer eingegangen, wie er beispielsweise im Anhang B des Stan- 
dard ISO/IEC 13818-7: 1997(E) als informativer Teil be- 
schrieben ist. Einem solchen Codierer liegt grundsatzlich 
die Idee zugrunde, das Quant is ierungsrauschen unter die 
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sogenannte psychoakustische Maskierungsschwelle zu bringen, 
d, h. 2u verstecken. Zur Transformation der Audio-Abtastwer- 
te in den Frequenzbereich, d. h. zum Erzeugen der spektralen 
Darstellung des Audiosignals wird eine Analysef ilterbank 
eingese-bz-t, die als kritisch-unterabgetastete DCT (DCT = 
diskrete Cosinustransf ormation) realisiert ist, und die ei- 
nen Uberlappungsgrad von 50% hat, Ihr Zweck besteht darin, 
eine spektrale Darstellung des Eingangssignals zu schaffen, 
das schlie/31ich quantisiert und codiert wird. Zusairunen mit 
einer entsprechenden Filterbank im Decodierer entsteht somit 
ein Synthese/Analyse-System. 

Das psychoakustische Modell^ das in solchen Codierern ver- 
wendet wird^ basiert auf dem psychoakustischen Phanomen der 
Maskierung . Sowohl Frequenzbereichsmaskierungsef f ekte als 
auch Zeitbereichmaskierungseffekte konnen dabei modelliert 
werden. Das psychoakustische Modell liefert einen Schatzwert 
fur "Rausch"-Energie, die dem ursprunglichen Audiosignal 
hinzugefiigt werden kann, ohne dal3 horbare Storungen auftre- 
ten. Diese maximal zulassige Energie wird als psychoakusti- 
sche Maskierungsschwelle bezeichnet. 

Der Quantisierer 22 sowie der Codierer 24 in Fig. 1 werden 
im nachfolgenden beschrieben. Typischerweise wird mehr als 
eine Spektrallinie mit derselben Quantisierer-Schrittgrofie 
quantisiert. Daher werden mehrere benachbarte Spektrallinien 
in sogenannte Skalenf aktorbander gruppiert. Der Quantisierer 
optimiert die Quantisierer schrittgroBe fur jedes Skalenf ak- 
torband. Die QuantisiererschrittgroBe wird so bestimmt, dafi 
der Quantisierungsfehler unter oder gleich der berechneten 
psychoakustischen Maskierungsschwelle ist, um sicherzustel- 
len, daB das Quantisierungsrauschen unhorbar ist. Es ist zu 
sehen^ daB zwei Begrenzungen beriicksichtigt werden miissen, 
zwischen denen ein KompromiB gefunden werden muB. Einerseits 
sollte der Bitverbrauch so niedrig als moglich gehalten wer- 
den, um hohe Kompressionsverhaltnisse, d. h. einen hohen Co- 
diergewinn, zu erreichen. Andererseits muB sichergestellt 
werden, daB das Quantisierungsrauschen unter der psychoaku- 
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stischen Maskierungsschwelle ist, damit im codierten und 
wieder decodierten Audiosignal keine Storungen horbar sind. 
Typischerweise wird dieses Optimierungsverf ahren in einer 
iterativen Schleife berechnet. Das Resultat dieser Schleife 
ist eine QuantisiererschrittgroBe, die mit einem Skalenfak- 
tor fur ein Skalenf aktorband eindeutig korrespondiert . An- 
ders ausgedriickt: werden die Spektralwerte eines Skalenfak- 
torbandes mit einer QuantisiererschrittgroBe quantisiert, 
die dem fiir das Skalenf aktorband maBgeblichen Skalenfaktor 
eindeutig zugeordnet ist. Das heiBt, daB zwei verschiedene 
Skalenf aktoren auch zwei verschiedene Quantisiererschritt- 
groBen zur Folge haben konnen. 

Der Bitstrom wird durch einen Bitstroiranultiplexer zusammen- 
gesetzt^ der im wesentlichen Format ierungsaufgaben erflillt* 
Der Datenstrom^ der im Falle eines Binarsystems ein Bitstrom 
ist, enthait somit die guantisierten und codierten Spektral- 
werte Oder Spektralkoef f izienten sowie die Skalenf aktoren 
und weitere Seiteninf ormationen, die im erwahnten MPEG-AAC- 
Standard detailliert dargestellt und erlautert sind. 

Fig. 2 zeigt ein detaillierteres Blockdiagramm der Wasser- 
zeicheneinrichtung 2 0 von Fig. 1. An einer Quelle 30 fiir 
Inf ormationseinheiten werden Inf ormationseinheiten, vorzugs- 
weise in Form von Bits, einer Einrichtung 32 zum Spreizen 
zugefuhrt. Die Einrichtung 32 zum Spreizen basiert grund- 
satzlich auf einer Spread-Spektrum-Modulation, die insbeson- 
dere unter Verwendung einer Pseudo-Noise-Spreizseguenz bei 
einer Korrelation im Wasserzeichenextraktor glinstig ist. Die 
Informationen werden Bit fiir Bit mit der Spreizsequenz be- 
aufschlagt. Das Beauf schlagen findet vorzugsweise so statt, 
daB fiir ein Inf ormationsbit mit einem logischen Pegel von +1 
die Spreizsequenz unverandert am Ausgang der Einrichtung 32 
erzeugt wird, wahrend fiir ein Inf ormationsbit mit einem lo- 
gischen Pegel von 0, was beispielsweise einem Spannungspegel 
von -1 entsprechen kann, die umgekehrte Spreizsequenz am 
Ausgang der Einrichtung 32 erzeugt wird. Damit entsteht ein 
"Zeitsignal" am Ausgang der Einrichtung 32, das die ge- 
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enthMlT' ^'^'^^^'^^^^-^ Q-lle 30 fur Inforxnationen 

enthalt. Dxeses gespreizte Inf ormationssignal wird dann 
durch exne Exnrichtung 34 zuxn Trans formieren in seine spek- 
trale ^arstellung Uberf.hrt, die ein FPT-Algorith.us, Le 
MDCT, etc., aber auch eine Filterbank sein kann. Die spek- 
trale Darstellung des gespreieten Inf ormationssignals wird 
xn eaner Exnrichtung 36 gewichtet, um dann mit den Spektral- 
werten xn einer Einrichtung 38 sumzniert zu werden, derart 

^^ieTen'^'T"!,^" Sumaen-Spektralwert; 
anlxegen, dxe dann bezugnehmend auf Fig. i guantisiert (22) 
und codxert (24) werden konnen, urn dem Bitstroxn-Multiplexer 
26 zugefuhrt zu werden. Die Wasserzeicheneinrichtung 20 ent- 
halt ferner eine Einrichtung 40 zum Ermitteln der n^askierba- 

SoektrlrT^" Kurzzeitspektrun., das durch die 

Spektralwerte gegeben ist. 

fomULeren des gesprei«en Informationssignals vorzugsweise 
eine Spektraltransformation durchfUhrt, die der dem Daten- 
stron> am Eingang des Demultiplexers 10 (Fig. i, eugrunde 

rlchtunrj""*"™"'"" daB die Bin- 

rxchtung 34 zum Transfomieren vorzugsweise dieselbe modifi- 

zxerte diskrete Cosinustransformation durchfUhrt, die ur- 

ve^eldef nicht-verarbeiteten Datenstrcms 

verwendet vmrde. Dxes ist ohne weiteres moglich, da Informa- 
txonen „.e z. B. Penstertyp, Fensterfor,„, Fensterlange 
us„. , als Saxtenlnformationen i„ Bitstrom Ubertragen werden 

ge:;!nT^"'"""' ' ^estrxchelt darl 

Ie!tet Bitstrom-Demultiplexer 10 (Fig. i, ange- 

Hie es bereits bezugnehmend auf Fig. l ausgeffihrt worden 
ist werden die Suraen-Spektralwerte nach der Addition im 
Summierer 38 wieder einer Quantisierung und Codierung unte^ 

:::::ilTh"d '\"°' .''^ '-'^ OuantisLenn. 
tervall, d. h. die QuantisiererschrittgroBe, auf die bereits 
eingegangen worden ist, besti™t werden soil, d. h. ob die 
Iteratlonen erneut durchgefUhrt werden mUssen, Oder ob dar- 
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auf verzichtet werden kann^ Aufgrund der Tatsache, daB die 
Wasserzeichenenergie im Vergleich zur Audiosignalenergie ub- 
licherweise sehr klein ist, konnen vorzugsweise dieselben 
Skalenf aktoren wie im urspriinglichen Bitstrom eingesetzt 
werden. Dies ist in Fig- 1 durch die Verbindungslinie 14 vom 
Demultiplexer 10 zum Multiplexer 26 dargestellt. Das heiJ3t, 
daiJ das Quantisieren durch den Quantisierer 22 wesentlich 
einfacher durchgefuhrt werden kann^ da es nicht mehr notwen- 
dig ist (aber dennoch moglich ist), die Iterationsschleif en 
auszufuhren, um einen optimalen KompromiB zwischen Bitrate 
und Quantisiererschrittgroiie zu bestimmen. Stattdessen wer- 
den vorzugsweise einfach die bereits bekannten Skalenfakto- 
ren verwendet. 

Im nachfolgenden wird auf verschiedene Moglichkeiten einge- 
gangen, um die durch das Kurzzeitspektrum maskierbare Stor- 
energie zu ermitteln, die beim Gewichten der spektralen Dar- 
stellung des gespreizten Inf ormationssignals benotigt wird. 
Hierzu existieren verschiedene Moglichkeiten, die nachfol- 
gend bezugnehmend auf die Fig. 3a-3d erlautert sind. 

In Fig. 3a wird ein psychoakustisches Modell eingesetzt, um 
unter Verwendung der Spektralwerte des Audiosignals die psy- 
choakustische Maskierungsschwelle des entsprechenden Kurz- 
zeitspektrums zu errechnen. Aufgrund der Tatsache, daJ3 psy- 
choakustische Modelle in der Literatur und dem erw^hnten 
Standard beschrieben sind, sei hier lediglich erwahnt, daJi 
vorzugsweise psychoakustische Modelle verwendet werden kon- 
nen, die ohnehin mit Spektraldaten arbeiten bzw. eine 
Zeit/Frequenz-Trans formation beinhalten. In diesem Fall ist 
das psychoakustische Modell zum urspriinglichen psychoaku- 
stischen Modell, das einem jedem Codierer zugrunde liegt, 
darin vereinfacht, daB dasselbe gleich mit Spektralwerten 
"gefiittert" werden kann, so daB liberhaupt keine Fre- 
quenz/Zeit-Transf ormation im psychoakustischen Modell erfor- 
derlich ist. Das psychoakustische Modell schlieBlich wird 
die psychoakustische Maskierungsschwelle fiir das Kurzzeit- 
spektrum ausgeben, derart, daB im Block 36 (Fig. 2) das 
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Spektrum des gespreizten Inf ormationssignals so geformt 
werden kann, daJ3 es in jedem Skalenf aktorband eine Energie 
hat, die gleich der psychoakustischen Maskierungsschwelle 
bzw. unterhalb der psychoakustischen Maskierungsschwelle in 
dxeseiu Skalenfaktorband ist. Es sei darauf hingewiesen, da/3 
dxe psychoakustische Maskierungsschwelle eine Energie ist 
wobei es angestrebt wird, daJ3 die spektrale Darstellung des 
informationssignals xnSglichst gleich der psychoakustischen 
Maskierungsschwelle ist, um die Informationen in das Audio- 
sagnal durch moglichst viel Energie einzubringen, um in ei- 
nem Extraktor des Wasserzeichens moglichst gute Korrelati- 
onsspitzen zu erhalten. 

Die in Fig. 3a gezeigte erste Moglichkeit hat den Vorteil 
daB die psychoakustische Maskierungsschwelle sehr genau be- 
rechnet werden kann, und dai3 dieses Verfahren mit ublichen 
Datenstromen vollstSndig kompatibel ist. Nachteilig darin 
xst jedoch die Tatsache, daJ3 die Berechnung eines psycho- 
akustischen Modells ublicherweise relativ zeitaufwendig sein 
kann, so daJ3 gesagt werden kann, daJ3 diese Moglichkeit zwar 
sehr genau und interoperabel ist, jedoch relativ viel zeit 
benotigt. 

Eine weitere Moglichkeit, die in Fig. 3b gezeigt ist, um die 
psychoakustisch maskierbare Storenergie zu erhalten, besteht 
darin, daB im Codierer, der den Datenstrom am Eingang des 
Demultiplexers 10 (Fig. i, erzeugt hat, die psychoakustische 
Maskierungsschwelle fur jedes Kurzzeitspektrum in den Bit- 
strom geschrieben wird, derart, daB die erf indungsgemSBe 
Vorrichtung zum Einbringen von Inf ormationen in einen Daten- 
strom lediglich die psychoakustische Maskierungsschwelle fur 
Dedes Kurzzeitspektrum aus den Seiteninf ormationen des Da- 
tenstroms zu extrahieren braucht (40b), um die psychoaku- 
stische Maskierungsschwelle zur Einrichtung 36 zum Gewichten 
der spektralen Darstellung des gespreizten Informationssi- 
gnals (Fig. 2) auszugeben. Diese Moglichkeit hat den Vor- 
teil, daB sie ebenfalls sehr genau ist und dariiberhinaus 
sehr schnell ist, da lediglich zugegriffen und nicht gerech- 
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net werden muB, es wird jedoch die Interoperabilitat beein- 
trclchtigt^ d. h. Standardbitstrome konnen nicht mehr nach- 
traglich mit Wasserzeichen versehen werden^ da sie keine 
psychoakustischen Maskierungsschwellen enthalten . Man 
benotigt hier somit einen erf indungsgemaBen Spezialcodierer ^ 
wie er in Fig. 4 beschrieben ist. 

In Fig. 3c ist eine weitere Moglichkeit zum Ermitteln der 
psychoakustisch maskierbaren Storenergie gezeigt. Hier wird 
die psychoakustisch maskierbare Storenergie unter Verwendung 
der Spektralwerte und der Skalenf aktoren berechnet (40c). Es 
wird davon ausgegangen, daJ3 der urspriingliche Codierer, der 
den Datenstrom, in den das Wasserzeichen eingebracht werden 
soli, erzeugt hat, die durch die Quantisierung eingefuhrte 
Storenergie bereits so gewahlt hat, daJ3 sie unter der psy- 
choakustischen Maskierungsschwelle bzw. auf der psychoaku- 
stischen Maskierungsschwelle liegt. Dieses Verfahren ist 
zwar etwas ungenauer als das direkte Berechnen der psycho- 
akustischen Maskierungsschwelle, ist jedoch im Vergleich zum 
direkten Berechnen der psychoakustischen Maskierungsschwelle 
sehr schnell und halt gleichzeitig die Interoperabilitat 
aufrecht, d. h. arbeitet auch mit Standard-Bitstromen zu- 
sammen. 

Im nachf olgenden wird darauf eingegangen, wieso diese dritte 
Moglichkeit etwas ungenauer ist. Es existieren verschiedene 
Codiereransatze, die sich beispielsweise in den verwendeten 
Quantisiererimplementationen unterscheiden. Wie es bereits 
ausgefiihrt worden ist, darf ein Quant is ierer die vorge- 
schriebene Bitrate nicht uberschreiten. Andererseits soli er 
die psychoakustische Maskierungsschwelle einhalten. So kann 
der Fall auftreten, dai3 ein Quantisierer die zur Verfugung 
stehende Bitrate gar nicht benotigt, da beispielsweise eine 
hohe Bitrate vorliegt, oder wenn ein Musikstuck zu codieren 
ist, bei dem der Codiergewinn sehr hoch ist, wie es bei- 
spielsweise bei tonalen Stiicken der Fall ist. Bestiitunte 
Quantisierer arbeiten hier so, daB sie feiner als notig 
quantisieren und somit wesentlich weniger Storenergie durch 
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Quantisieren in das Audicsignal ainfUhren, als sie dfirften 
ES ist daher einsichtig, daB die erfindungsgemMe Vorrich- 
tung, „.e sie in Pig. 3c beschrieben ist, davon ausgeht, daB 
dxe psychoakustische Maskierungsschwelle wesentlich geringer 

fuhrt, daB d.e spektrale Darstellung des gespreizten Infor! 
matxonssxgnals nach den Gewichten wesentlich weniger Energie 
hat als s.e haben dUrfte, wodurch nlcht die ganze verfUgb^^ 
Energxe die das Wasserzeichen haben dttrfte, ausgenutzt 
wxrd. Dxes vmrde ^edcch nlcht der Pall sein, wenn .il ZlT- 

verKl" H^': °"-*"i-e„ einftthrt und eventueL 

^1 etner .' ^-hreibt bz„. „it irgendwelchen 

bex exner Decodxerung nicht berUcksichtxgten werten funt 
xn dxesoK, Pall „Sre die in rig. 3c dargestellte option gel 
nauso genau „ie die bexden ersten MSglichkeiten. I. PaLe 
des varxablen Ouantlsierers entsteht jedoch auch eine va! 
rxable Bxtrate. in dxesem Pall kSnnte die wasserzeichenein- 
rxchtung auch dazu verwendet werden, die Bltrate konstant zu 
machen. durch Auffaiien von Bits, die das Wasserzeichen dar- 

Bxtrate des ursprunglichen Datenstroms nit variabler Bitrate 

in nachfolgenden „ird darauf eingegangen, „ie unter Verwen- 
dung der Spektralwerte und der skalenfaktoren und darUblr- 
hxnaus der Charakteristik des Ouantisierers die storenergie 
berechnet wird, die durch Quantisieren in eln skalenfakt!" 

S^ektrriwerTxT; 0->"^ierungs.ehlers .Ur einen' 

ES sei darauf hingswxesen, daB diese Gleichung fur ungleioh- 
-aBxge Quantxsierer gilt, „ie sie beispielsweisa bei den 

32:^^"^^;*"' 9leichn.Bige Quanti! 

sxerer wurde der zwexte Term einfach wegf alien, wenn fUr a = 
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1 gesetzt wird. 



Der in der Gleichung auftretende Faktor q hangt mit der 



QuantisiererschrittgroBe QS folgendermafien zusammen: 
q 2QS/4 

Der Faktor a lautet fur den MPEG-AAC-Quantisierer 3/4. 

Die Energie des Quantisierungsf ehlers in einem Skalenfak- 
torband ist dann die Summe der | Fxi | ^ in einem Skalenf ak- 
torband. Diese Energie inui3^ damit sie nicht horbar ist^ 
kleiner oder gleich der psychoakustischen Maskierungsschwel- 
le in diesem Skalenf aktorband sein. Es sei darauf hingewie- 
sen, daB die psychoakustische Maskierungsschwelle in einem 
Skalenf aktorband konstant ist, jedoch fiir unterschiedliche 
Skalenf aktorbSnder unterschiedliche Werte einnimmt. Fur die 
Energie des Quantisierungsf ehlers Xj^i^ ergibt sich folgender 
Wert: 

xmin = S[ (23/8-QSj/(27/4) • Xil/2j 



Der Index i soil anzeigen, daJ3 immer iiber die Spektralwerte 
in einem Skalenf aktorband suramiert werden muJ3, da die psy- 
choakustische Maskierungsschwelle ublicherweise als Energie 
fur dieses Skalenf aktorband gegeben ist. 

Es sei darauf hingewiesen, daJ3 in den Seiteninf ormationen 
des Datenstroms nicht direkt die QuantisiererschrittgroBen 
fur die einzelnen Skalenf aktoren gegeben sind, daB jedoch 
gemaB Vereinbarung, wie sie im AAC-Standard aufgefiihrt ist, 
die QuantisiererschrittgroBe, die jedem Skalenf aktor zuge- 
ordnet ist, eindeutig abgeleitet werden kann. Dariiberhinaus 
muB die Charakteristik des im ursprlinglichen Codierer zum 
Erzeugen des Datenstroms verwendeten Quantisierers bekannt 
sein, d. h., wenn er ein ungleichmaBiger Quantisierer ist, 
der Kompressionsf aktor desselben, der beim AAC-Standard der 
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Faktor 3/4 ist. 



Die spelctrallinien der spektralen Darstell„„, des gespreiz- 
ten infoo^ationssignals warden nun, „ie es bereits ausae- 
fuhrt worden ist, so gewlchtet, dafl si. zusa™,en eine E„L 
gxe haben, die kleiner Oder gleich der psychoakustisoh „as- 
kierbaren Storenergie, und i„ Palle der in Fig. 3c beschrxe- 
^"es fst" Quantisierungspro- 

wenn der Fall betrachtet „ird, daB die durch die Quanti- 
sxerung in skalenfaktorband eingefUhrte StOrenergie bereits 

!^n^^''^^K''^'""'°^'"'""''''^'' "^^l^i^ungsschwelle ist, und 
dann dxeselbe Energie nooh eimnal, jedoch nun fiir die ein- 

ItriTlZ " Audiosignal eingebracht 

wxrd, so :Lst zu sehen, dafl die insgesamte Energie, d. h. die 
Storenergxe aufgrund des Ouantisierens und die Energie fur 
Uberfr^ P=y-=hoakustische Masfcierungsschwelle 

uberschrerten Mnnen, was 3u hSrbaren Qualitatsverlusten 
fuhren kann, die Jedoch aufgrund der Begrenzung der Energie 
der informatxonen au£ die psychoakustische Maskierungs- 
schwelle klein «?«:>in t»/:>v->i^„ j "o'^j-etungs- 
run««=o>, if werden, da die psychoakustische Maskie- 

rungsschwelle urn einen Faktor groBer als 1 verletzt wird 
Wae es bereits ausgefuhrt worden ist, wird eine Wasserzei- 
chenenergae in der Groi3enordnung der psychoakustischen Mas- 
k.erungsschwelle dann zu St5rungen fUhren, wenn auch das 
Quantxsxerungsrauschen bereits in der Gr6i3enordnung der 
psychoakustischen Maskierungsschwelle liegt. Es wird daher 
bevorzugt, die psychoakustisch maskierbare St6renergie, mit 
der gewxchtet wird, so zu wShlen, dai3 die gesaxnte St6r;ner- 
gxe (Quantisierungsrauschen plus "StSrenergie" der Informa- 
txonen) kleiner als das 1,5-fache der psychoakustischen 
Maskxerungsschwelle ist, wobei noch kleinere raktoren bis 
nahe l,o moglxch sind. Es sei darauf hingewiesen, daJ3 auch 

xnf:^at"''°^^" ^"^^^""^ ^P-^-"- ^es 

IZaT^lT"^"^""^" ^"^^ informationsredundanz 

eingefuhrt worden ist. 
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Anders ausgedriickt wird das Einbringen eines Wasserzeichens 
in ein Audiosignal, dessen psychoakustische Maskierungs- 
schwelle bereits vollstandig durch Storenergie aufgrund des 
Quantisierens verbraucht ist, zu einer geringen Verschlech- 
terung der Audioqualitat flihren^ die jedoch durch die Vor- 
teile des Wasserzeichens leicht aufgehoben wird. 



Um diese Beeintrachtigung zu liberwinden, kann das in Fig. 3d 
gezeigte Konzept eingesetzt werden^ bei dem von vorneherein 
der Quantisierer im Codierer derart gesteuert wird, daJ3 die 
durch die Quantisierung eingefiihrte Storenergie durch Ein- 
stellen der Quantisiererschrittgrolie so gewahlt wird, daJ3 
sie immer einen vorbestiinmten Betrag unter der psychoakusti- 
schen Maskierungsschwelle bleibt. Mit anderen Worten arbei- 
tet ein Audiocodierer fiir ein solches Konzept: so, daB er 
f einer quantisiert als notig, wodurch ein Energiepotential 
flir die einzubringenden Inf ormationen, d. h. fiir das Wasser- 
zeichen freibleibt. Dies hat den Vorteil, daB ein Wasserzei- 
chen vollstandig ohne Qualitatsverlust eingebracht werden 
kann, wenn beim Ermitteln der psychoakustisch maskierbaren 
Storenergie (40d) die ja nun um einen vorbestimmten Betrag 
kleiner als die psychoakustische Maskierungsschwelle ist, in 
der Einrichtung 40d der vorbestimmte Betrag berlicksichtigt 
wird, so daB die Storenergie aufgrund des Quantisierens und 
die Energie aufgrund der einzubringenden Informationen zu- 
sammen gleich oder kleiner als die psychoakustische Maskie- 
rungsschwelle sind. Da die gewichteten Spektralwerte des ge- 
spreizten Informationssignals mit den Spektralwerten des 
Audiosignals summiert werden, sind die Spektralwerte des In- 
formationssignals nach ihrer Gewichtung gleich oder kleiner 
als der vorbestimmte Betrag. 

Diese Option hat den Vorteil, daB ein Wasser zeichen ohne 
jeglichen Qualitatsverlust in einen Datenstrom eingebracht 
werden kann, daB jedoch einerseits die Interoperabilitat 
leidet, und da der Quantisierer im Codierer immer um den 
vorbestixmnten Betrag unter der psychoakustischen Maskie- 
rungsschwelle bei der Einstellung der Storenergie durch das 
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Quantisieren bleiben muB. Andererseits ist diese MSglichkeit 
in der Implementation sehr effizient, da kein psychoakusti- 
sches Modell berechnet werden muB. 

im nachfolgenden wird auf Fig. 4 eingegangen, wobei Fig 4 
zwei MSglichkeiten fur einen Codierer fur Audiosignale 
zexgt, um einen Datenstrom zu erzeugen, der erf indungsgemSB 
besonders fur ein Einbringen von Informationen geeignet ist 
Exn solcher Audiocodierer kann grundsStzlich so aufgebaut 
sem, wie ein bekannter Audiocodierer, derart, daB er eine 
Einrxchtung 50 zum Erzeugen einer spektralen Darstellung des 
Audiosignals, einen Quantisierer 52 zum Quantisieren der 
spektralen Darstellung des Audiosignals, einen Entropie-Co- 
dierer 54 zum Entropie-Codieren der quantisierten Spektral- 
werte und schlieBlich einen Datenstrommultiplexer 56 umfaBt 
Der Datenstrom, der von dem Datenstrom-Multiplexer 56 ausge- 
geben wird, erhalt von einem ebenfalls bekannten psychoaku- 
stischen Modell 58 uber den Datenstrommultiplexer 56 die 
psychoakustische Maskierungsschwelle, die im Gegensatz zu 
emem bekannten Audiocodierer nun in den Datenstrom ge- 
schrieben wird, derart, daJ3 die erf indungsgemaBe Vorrichtung 
zum Einbringen von Informationen einfach auf die psychoaku- 
stische Maskierungsschwelle in dem Datenstrom zugreifen 
kann. Der in Fig. 4 durch die durchgezogene Linie 60 darge- 
stellte Codierer ist somit das Gegenstuck zu der in Fig i 
gezeigten Vorrichtung zum Einbringen von Informationen, die 
als Einrichtung zum Ermitteln der maskierbaren Storenergie 
die an Fig. 3b gezeigte Option enthSlt. 

in Fig. 4 gestrichelt ist die Audiocodierermoglichkeit gemaB 
der vorliegenden Erfindung dargestellt, die zu der in Fig 
3d gezeigten Option fiir die Einrichtung 40 zum Ermitteln der 
maskierbaren Storenergie in der in Fig. 1 gezeigten erfin- 
dungsgemaBen Vorrichtung korrespondiert . Hierbei wird der 
Quantisierer durch einen vorbestimmten Betrag derart gesteu- 
ert, daB die durch die Quantisierung eingefuhrte Storenergie 
urn den vorbestimmten Betrag unterhalb der psychoakustischen 
Maskierungsschwelle ist, wobei der Wert des vorbestimmten 



wo 01/26262 PCTyEPOO/09771 

- 27 - 

Betrags iiber die gestricheite Leitung 62 in den Datenstrom- 
multiplexer 56 eingespeist wird, urn in dem Datenstrom ent- 
halten zu sein, derart, daB die erf indungsgemaBe Vorrichtung 
zum Einbringen von Inf ormationen auf den vorbestimmten Be- 
trag zugreifen kann, um entsprechend gewichten zu konnen 
(Block 36 in Fig. 2), 
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Patenii ansp rnr'ho 

■ r!n'f T informationen in einen Da- 

tens tron,, der Daten uber Spektralwerte aufweist, die 
ean Kurzzeitspektrum eines Audiosignals darstellen, xnit 
folgenden Schritten: 

verarbeiten <lo, 16, 18, des Datenstroas, u„ die Spek- 
hlltl^! Kurz«itspektru„s des Audiosignals er- 

Beaufschlagen (32, der informationen mit einer Spreiz- 
hllten-' informationssignal zu er- 

InfoZt Spe,ctraldarstellung des gespreizten 

£o™ir ' -Pektrales gespreiztes In- 

formationssignal zu erhaltenj 

B^itteln (40a; 4Db, 40c; 40d, einer psychoakustisch 
das / 9ie als Function der Frequenz fUr 

das Kurzzeitspektrum des Audiosignals, wobei die psy- 
choakustisch maskierbare St6renergie kleiner Jsr 
gleich der psyohoakustischen Maskierungsschwelle des 
Kurzzeitspektrums Ist; 

Gewichten ,36, des spektralen gespreizten Informations- 
signals unter Verwendung der ermittelten Storenergie 
um ein gewichtetes Informationssignal zu erzeugen, bel 
t2j-V""T" ^^"'-'^"^'•ten informationen im «e- 

sentliohen gleioh Oder unterhalb der psyohoakustischen 
Maskierungsschwelle liegt; 

ZTTZ ' ^ewichteten Inforxaations signals mit 

den Spektralwerten des Kurzzeitspektrums des Audiosi- 
gnals, um Summen-Spektralwerte zu erhalten, die das 
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Kurzzeitspektrum des Audiosignals und die Inf ormationen 
umfassen; und 

Verarbeiten (22, 24, 26) der Sununen-Spektralwerte , um 
einen verarbeiteten Datenstrom zu erhalten, der die 
Daten iiber die Spektralwerte des Kurzzeitspektrums des 
Audiosignals und die einzubringenden Inf ormationen um- 



2. Verfahren nach Anspruch 1, bei dem der Datenstrom als 
Daten uber Spektralwerte quantisierte Spektralwerte 
enthalt/ wobei der Schritt des Verarbeitens des Daten- 
stroms folgenden Teilschritt aufweist: 

inverses Quantisieren (18) der quantisierten Spektral- 
werte, um die Spektralwerte zu erhalten; und 

bei dem der Schritt des Verarbeitens der Summen-Spek- 
tralwerte folgende Schritte aufweist: 

Quantisieren (22) der Summen-Spektralwerte, um quanti- 
sierte Summen- Spektralwerte zu erhalten; und 

Bilden (26) des verarbeiteten Datenstroms unter Verwen- 
dung der quantisierten Summen-Spektralwerte . 

3 . Verfahren nach Anspruch 2 , bei dem die quantisierten 
Spektralwerte im Datenstrom Entropie-codiert sind, wo- 
bei der Schritt des Verarbeitens des Datenstroms fol- 
genden Teilschritt aufweist: 

Entropie-Decodieren (18) der Entropie-codierten Spek- 
tralwerte, um die quantisierten Spektralwerte zu erhal- 
ten; und 



fafit. 



bei dem der Schritt des Verarbeitens der Summen-Spek- 
tralwerte folgenden Schritt aufweist: 
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5. 



■ I!rr"« r^'" --""^-henden AnsprUche, bei 

kierbaren Storenergie folgenden Sohritt aufweist: 

Frequenz unter Verwenduna 
exnes psychoa.ustischen Modells, das basierend ~ n 
Spektralwerten des Audiosignals arbeitet. 

Verfahren nach einem der AnsprUche 1 bis 3 bei H»n. • 
u ^ *'J-«quenz tur das Kurzzeitspektrum vnr- 

sch^elf"" T"' P-ychoakustischen MasWerungs- 

Zw!r^r f 9leich der paychoalcustlBchen 

Maskierungsschwelle ist. 

llllZZJ^T "''^ ^ ^' ^er 

Skale!^I^r seitaninfo^ationen aufweist, die 

Skalenfaktoren (14) belnhalten, mit denen die Spektral 
werte vor de. Ouantisieren in eine„ AudiocodLrer " p" 
pen„e.se .ultipli.iert „urden, wobei der ScJiJ'L 

Extrahieren der Skalenfaktoren aus de™ Datenstro™, und 
aulwelTt:'" ^rmitteins folgenden Schritt 



Bereohnen der bei. Ouantisieren i:. Audiocodierer ein- 
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gefiihrten Storenergie als Funktion der Frequenz unter 
Verwendung der Skalenf aktoren fiir das Kurzzeitspektrum 
und unter Verwendung der Spektralwerte sowie unter 
Kenntnis eines im Audiocodierer verwendeten Quantisie- 
rers, wobei die eingebrachte Storenergie ein MaB flir 
die psychoakustisch maskierbare Storenergie ist/ die 
beim Gewichten verwendet wird. 

?• Verfahren nach Anspruch 6, bei dem der Datenstrom gemaJ3 
ISO/IEC 13818-7 (MPEG-2 AAC) ausgebildet ist^ und bei 
dem der Schritt des Schatzens der Storenergie folgende 
Schritte aufweist: 

Ermitteln eines Quantisierungsschritts fiir die Spek- 
tralwerte aus einem Skalenf aktorband unter Verwendung 
des diesem Skalenf aktorband zugeordneten Skalenf aktors; 

Auswerten der folgenden Gleichung, urn die durch die 
Quantisierung eingefuhrte Storenergie fur das Skalen- 
f aktorband zu erhalten. 



wobei Xj^ die i-te Spektrallinie in einem Skalenf aktor- 
band darstellt/ wobei QS der Quantisierungsschritt fur 
dieses Skalenf aktorband ist^ und wobei xmin die durch 
die Quantisierung in das Skalenf aktorband eingefuhrte 
Storenergie ist; 

und bei dem der Schritt des Gewichtens (36) folgenden 
Schritt aufweist: 

Einstellen der Spektralwerte der spektralen Darstellung 
des gespreizten Inf ormationssignals in dem Skalenfak- 
torband so^ dafi die Gesamtenergie der eingestellten 
Spektralwerte gleich der im Schritt des Auswertens er- 
haltenen Storenergie in diesem Skalenf aktorband ist. 



xmin = S[(23/8*QS)/(27/4) • Xil/2j 



i 



11, 
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B. verfahren nach elnem der AnsprUche 1 bis , ^ 
aaB die durch die Ouantisierung eingefUhrte std 

w.rd, die de„ .o.be«i™.J„ ^n.^^^r, L^r""^ 

'e"df;.tlt:alf;o''^%T"='''^"^ -^^^ spek..alwe.- 

ticnssignat "erLt a ^-P-"*™ l„for.a- 

:::: r:r 

se.e..j::Lrder.ar;.^^^^^^^^ 

te di! , r verarbeitens der S„™e„-S^:^:i„er 
te die gleiohen Quantisierungsschrittwelten „iT 
spranglichen Datenstro. verwendet werden " 

ZlZZr -=.io.ignals „i. .oigenden 

l^~ax:\rr°::""':"^" -skierungss=h„eixe des 
«odells (ss', ^^"'-''"ng eines psy.hoafcustisohen 

X"d:rTsvch"!c — Berucksichti- 

die Ouantisierung eingefuhrte Storenergie 
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gleich oder kleiner als die psychoakustische Maskie- 
rungsschwelle ist; und 

Bilden (56) eines Bitstroms, der Werte enthalt, die den 
quantisierten Spektralwerten des Kurzzeitspektrums ent- 
sprechen, und der dariiberhinaus die berechnete psycho- 
akustische Maskierungsschwelle (60) fiir das Kurzzeit- 
spektrum des Audiosignals aufweist. 

12- Verfahren zum Codieren eines Audiosignals, mit folgen- 
den Schritten: 

Erzeugen (50) eines Kurzzeitspektrums des Audiosignals ,r 
das eine Mehrzahl von Spektralwerten umfaBt; 

Berechnen der psychoakustischen Maskierungsschwelle des 
Audiosignals unter Verwendung eines psychoakustischen 
Modells (58); 

Quant is ieren der Spektralwerte unter Berucksichtigung 
der psychoakustischen Maskierungsschwelle, so daJ3 die 
durch die Quantisierung eingefiihrte Storenergie urn ei- 
nen vorbestimmten Betrag kleiner als die psychoakusti^ 
sche Maskierungsschwelle ist; 

Bilden (56) eines Bitstroms, der Werte enthalt, die den 
quantisierten Spektralwerten des Kurzzeitspektrums ent- 
sprechen. 

13. Verfahren nach Anspruch 12, bei dem im Schritt des Bil- 
dens ferner eine Anzeige fiir den Wert (62) des vorbe- 
stimmten Betrags in den Bitstrom aufgenommen wird. 

14. Vorrichtung zum Einbringen von Inf ormationen in einen 
Datenstrom, der Daten iiber Spektralwerte aufweist, die 
ein Kurzzeitspektrum eines Audiosignals darstellen, mit 
folgenden Merkmalen: 
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li2lr^r''''^T 18, des oa- 

des Audaosignals zu erhalten; "^linMis 

elner Einrichtung zum Beauf schlagen (32) ds, T„f„ 
tionen eine. Spreizseguenz, u!, .in gesp/eiz.esTn' 

formationssignal zu erhalten; spreiztes I„- 

ZTl.TlT"' spektraldar- 
s^k«aL. sespxexzten Infor„ationsslg„als, un, em 
spektrales gespreiztes Informationssignal zu erhalten; 

elner Einrichtung zu™ Ermitteln <40a; 40b, 40c; 40d, 
-ner psychoakustisch n^skierbaren Storenergi; ali 
Punkt.on der rreguenz fUr das Kurzzeitspektru^'des L- 
enera!e Psychoakustisch .askierbare star- 

energ.e kleiner oder glelch der psychoakustischen Mae- 
kierungsschwelle des Kurzzeitspektrums ist, 

spre"zte7f f ''^ spektralen ge- 

^ZT. '"'"^"^""^-^f'^ls unter verwendung der L 

"gnai z"u e°"""''^' '--"tetes In^oLations- 

"gnal zu erzeugen, bei dem die Energie der einae 

tXT ^ -sentlichen g'leich Oder uT 

terhalb der psychoakustischen Haskierungsschwelle 



InfoL?"" ' <38) des gewlchteten 

infonnationss.gnals mlt den Spektralwerten des Kurz- 

u eraltr%'"H'"''°^''"^'=' ™ ^-^--P-'c-ralwrr^e 
und r . Kurzzeitspektrun. des Audloslgnals 

nnd die Infonnationen umfassen; und 

einer Einrichtung zum Verarbeiten (22, 24, 26) der 

ZllC^'TT "-'oatLst":™- 

Kurzz!-. T " ""^^ -^^^ spektralwerte des 

::n™~:j— ^^^^^ - - — - 
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15. Vorrichtung zum Codieren eines Audiosignals mit fol- 
genden Merkmalen: 

einer Einrichtung zum Erzeugen (50) eines Kurzzeitspek- 
trums des Audiosignals, das eine Mehrzahl von Spektral- 
werten umfaBt; 

einer Einrichtung zum Berechnen der psychoakustischen 
Maskierungsschwelle des Audiosignals unter Verwendung 
eines psychoakustischen Modells (58); 

einer Einrichtung zum Quantisieren (52) der Spektral- 
werte unter Beriicksichtigung der psychoakustischen Mas- 
kierungsschwelle, so dai3 die durch die Quantisierung 
eingefiihrte Storenergie gleich oder kleiner als die 
psychoakustische Maskierungsschwelle ist; und 

einer Einrichtung zum Bilden (56) eines Bitstroms, der 
Werte entha.lt, die den quantisierten Spektralwerten des 
Kurzzeitspektrums entsprechen, und der darliberhinaus 
die berechnete psychoakustische Maskierungsschwelle 
(60) fur das Kurzzeitspektrum des Audiosignals au£- 
weist. 

16. Vorrichtung zum Codieren eines Audiosignals, mit fol- 
genden Merkmalen: 

einer Einrichtung zum Erzeugen (50) eines Kurzzeit- 
spektrums des Audiosignals, das eine Mehrzahl von Spek- 
tralwerten umfaBt; 

einer Einrichtung zum Berechnen der psychoakustischen 
Maskierungsschwelle des Audiosignals unter Verwendung 
eines psychoakustischen Modells (58); 



einer Einrichtung zum Quantisieren der Spektralwerte 
unter Beriicksichtigung der psychoakustischen Maskie- 
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rungsschwelle. so daB die durch die Quantisierung ei„- 
gefuhrte storenergie einen vorbesti„™te„ Betrag 

We.ner als die psychoaKustische Mas.ierungsschweXl! 



werte enthalt, die den quantisierten Spektralwerten da, 
Kurzzeitspektrvuns entsprechen. -^"arten des 
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